iT邦幫忙

2023 iThome 鐵人賽

DAY 29
0
tags: 第 16 屆 iThome 鐵人賽 (2023)

{%hackmd BJrTq20hE %}

YOLO物件偵測與其他物件偵測有啥不同的?

YOLO的核心思想是將物體檢測視為回歸問題,並將圖像分成一個固定的網格,每個網格單元負責預測該區域內的物體。該論文詳細介紹了YOLO的架構、損失函數和訓練過程。

  • YOLO引入了單一前向傳播過程,以實現即時物體檢測。
  • 該方法將物體檢測視為回歸問題,使得物體位置和類別的預測可以一次性完成。
  • YOLO提供了高度準確的物體定位和分類結果,並在實時應用中表現出色。

卷積神經網路

YOLO的卷積網路架構是來自GoogleNet的模型,YOLO的網路有24卷積層(convolutional layer)和2層全連結層(fully connected layer),和GoogleNet不同的地方在於作者在某些3×3的卷積層前面用1×1的卷積層來減少filter數量,整體架構如下圖。

YOLO家族族譜

Yolo v7主要特點

引入幾項架構重塑提高了速度和準確性。與Scaled YOLOv4類似,YOLOv7的骨架不使用ImageNet預訓練的骨架。相反,這些模型完全使用COCO數據集來訓練。因為YOLOv7與Scaled YOLOv4是由同一作者編寫的,因此架構相近。在YOLOv7的論文中引入了以下主要變化:

  • 擴展的高效層聚合網路 E-ELAN (Extended Efficient Layer Aggregation Network)

參考文章

https://chih-sheng-huang821.medium.com/%E6%B7%B1%E5%BA%A6%E5%AD%B8%E7%BF%92-%E7%89%A9%E4%BB%B6%E5%81%B5%E6%B8%AC-you-only-look-once-yolo-4fb9cf49453c


上一篇
DAY 28 YOLOv7 影像辨識應用
下一篇
DAY 30 鐵人賽最終章
系列文
Diffusion 模型、物件偵測Yolo v7& Yolo v4 30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言